查看原文
其他

新算法帮助机器像人类一样快速学习

2016-01-23 John IntelligentThings

戳蓝色字关注IntelligentThings




一个新的概率性的人工智能算法,展示了单次学习可视化概念和与人类不同的方式操作他们。

(图片来源于: Danqing Wang/纽约大学)


来自纽约大学,多伦多大学和麻省理工学院的一个人工智能方面的科学突破,突出展示了在单次学习视觉概念使用人工智能,并且以类似人类的方式操作他们。它可以使得手机更加智能,显著提高语音识别,以及让电脑更好地理解周围世界。


楚巴卡效应


人类展示了在工作中学习事务的巨大能力:例如,在相依物体前,只需要展示给孩子们一次例如狗狗或者校车这样的新东西,他们可以自己分辨。研究人员相信,敏捷度背后的一个原因就是,我们经常把熟悉的部分作为整体来一起认识。我们第一次见到两轮平衡车 ,我们很快的把它当作轮子和手柄,概括为合理的某种程度上的确定性,它可能是某种形式的交通工具。


语言也是一样。当我们看到纸上的字符,甚至不熟悉的那些,我们不会只是看到纸上的墨水,也会看到一些列笔触,所以我们可以简单的自己复制那些字符。并且当我们第一次看到一个不熟悉字符 ,像楚巴卡一样,不知道它的意思,但是可以重复它的发音,因为我们按照可以产生它们的肌肉运动来解析声音。


将不幸地是,这种非凡的一次学习能力转化到人工智能范畴,具有很大的挑战。达到最高水准的主要关注于模式识别的“深度学习”算法,这样他们只有在被仔细训练学习范例成百上千次后才可以表演。尽管这样,这个软件可以被动的理解事物,以一种屏幕上像素点的方式,而不是使用概念创造新的东西。


整个人工智能领域,只有几十年的历史,但是人类学习的根本机制,已经困扰了哲学家几千年。这是一个归纳法的问题,或者是人类意识如何能够从有限数量的例子里面有效地产生抽象,包容的概念。


一个新希望


研究人员Joshua Tenenbaum, Brendan Lake 和 Rusian Salakhutdinov 现在已经向在电脑内复制这种单发的学习机制迈出了重要的一步。这个概率系统,它们称为贝叶斯程序学习(BPL),对于语音识别和合成,图像识别以及自然语言处理,是很重要的一步。但是更加普遍的是,可以让电脑在学习逐步执行更加复杂任务的基础上,更好的理解周围的世界。


软件以三个原则构建,语意合成性(以更加原始的部分构建抽象表达的理念),因果关系(使用原始的部分构建一个复杂的结构)和学会学习(以前的知识概念使得学习新概念更加容易得原则)。在实践级别,贝叶斯概率论法,是算法的核心,并且被用来基于有限的数据,得出简单的部分组成更加复杂视觉物体的结论。)


“我们的工作基于,通过我们的意识构建和操作的简单电脑程序,抓取人类的精神模型。”Lake说道,“第一次我们认为我们拥有一个极其复杂的学习系统,可以以人类相似的方式学习更多的视觉概念。”


团队的软件已经用真实和虚构的1600个世界各种语言的生疏字符,,进行了测试。作为反馈,一个字符的手绘版本作为起点,算法能够成功地从其他所有的字符中识别它,把它分为一些列的笔画然后写它,甚至重新通过让人类的眼睛仍然可以辨认的小的变种来重写它。


这种分解复杂图形和尝试理解它的部件如何一起工作的方法,让软件可以产生具有创造性的任务,是基于模式识别的算法不可能单独完成的。当我们遇到一个不熟悉字母,例如,研究人员的软件从笔画中提取的一般属性,组成每个字符,并且能够通过这些属性创造新的字符。


软件对于这种创造性需求的任务完成得很好,通过图灵测试证实,它的性能几乎和人类没有什么区别。在测试中,147测试提每次出了49个试验,一组字母符号,以及通过这些字符启发的两个额外字符,一个通过人类创造,一个通过软件创造。在一起,评委只能区分52%电脑产生的字符,这比一半一半的猜想没有好多少。


表演者


“算法目前只对手写字符有效,但是我们相信基于概率程序归纳的更广泛的办法可以导致语音识别和对象识别的进展,” Lake说。


一种可以提高语音识别的办法是通过你的智能手机帮助选择。就像操作一个不熟悉的字符,软件可以“读懂用户的心”并且基于用户发音的嘴形转录一个不熟悉的词语。它可以更进一步,并且让用户学习新的词语,以及下一个定义。接着软件能够增加单词到词汇表中,并且将来正确地在上下文中使用。


其他可能的任务可以包括识别一幅画的整体部分的识别,从它的组件来猜测一个生疏物体的功能,以及得到比人类更好的对于自然语言的理解。(比仅仅语音识别更多的需要,并且可以让我们通过电脑和智能手机,转化任何话题,包括气象,交通和体育比赛结果。)


所以,当人工大脑的速度和复杂性,被达到高复杂性的因素所绑定,这个新研究称一个适当的学习算法从非常有限的数据分解和操作有用的信息,可以同样决定获取人类级别的智能。


然而,它的性能警告研究人员,将高度地依赖于从更加复杂的构建的特定领域中,仔细选择最基本的部分(笔画,音素,等等)。


这项研究发表在最近的自然杂志。




文章来源于: gizmag.com,

点击左下角阅读原文,可访问原文链接。

编译: IntelligentThings




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存